一直显示?点击任意区域即可关闭
文库
文章列表
全部分类
全部标签
可视化理解
标签
LLM
12
算法原理
8
LLM, DPO
1
vLLM
1
llamacpp
1
LLM, train
1
Tools
1
Agent
1
vue
1
前端
1
博客
主站
项目
Demo
Phimes
文库
文章列表
全部分类
全部标签
可视化理解
标签
0
LLM, DPO
1
LLM
12
算法原理
8
LLM, DPO
1
vLLM
1
llamacpp
1
LLM, train
1
Tools
1
Agent
1
vue
1
前端
1
更多
加载中...
工程实现系列:从什么都不会到QLoRA分布式DPO(一)
1 引言 领导看了几篇营销号推文,突然要求在有限的算力上部署和微调大模型。当你开始研究,却发现眼前摆着一堆框架和工具,你好不容易理清楚了发现无从下手: - 训练框架:accelerate、deepspeed、llamafactory、megatron、unsloth... - 部署方案:vllm、o...
LLM, DPO
3/28
1